home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group98b.txt / 000015_icon-group-sender _Wed May 6 12:36:51 1998.msg < prev    next >
Internet Message Format  |  2000-09-20  |  3KB

  1. Return-Path: <icon-group-sender>
  2. Received: from kingfisher.CS.Arizona.EDU (kingfisher.CS.Arizona.EDU [192.12.69.239])
  3.     by baskerville.CS.Arizona.EDU (8.8.8/8.8.7) with SMTP id MAA07362
  4.     for <icon-group-addresses@baskerville.CS.Arizona.EDU>; Wed, 6 May 1998 12:36:51 -0700 (MST)
  5. Received: by kingfisher.CS.Arizona.EDU (5.65v4.0/1.1.8.2/08Nov94-0446PM)
  6.     id AA15209; Wed, 6 May 1998 12:36:47 -0700
  7. From: gep2@computek.net
  8. Date: Wed, 6 May 1998 12:04:42 -0500
  9. Message-Id: <199805061704.MAA14525@axp.cmpu.net>
  10. Mime-Version: 1.0
  11. Content-Type: text/plain
  12. Content-Transfer-Encoding: 7bit
  13. Subject: AI use for Icon
  14. To: icon-group@optima.CS.Arizona.EDU
  15. X-Mailer: SPRY Mail Version: 04.00.06.17
  16. Errors-To: icon-group-errors@optima.CS.Arizona.EDU
  17. Status: RO
  18. Content-Length: 2300
  19.  
  20. > I'm writing a program with icon that reads an email message and
  21. determines the who, what, when, where and by whom. At least that is what
  22. I am trying to do.  This message would come form a supervisor to the
  23. human resources department asking them to promote Mr. Any Body to a New
  24. Title on a certain date.  By having all the employees names prior to
  25. running the program I weight each name based on its reletive position to
  26. the other name within the organization to get a fuzzy match.  One of
  27. which must be a supervisor.  I've never tried using AI technology before
  28. so I looking for someone who has done something similar that would share
  29. with me their text parse-ing process for ideas.  I'm currently looking
  30. for words that match my list as for the 'what' the matching terms would
  31. be 'promote, demote, reassign, realign, fire...'.  Likewise, 'who' is
  32. the list of employees.
  33.  
  34. Sounds like an interesting problem!  
  35.  
  36. For the "fuzzy match" I think that one interesting way to at least help winnow 
  37. down the possibilities would be to examine the intersection of the character 
  38. sets of the different names.  Those which have a high intersection (all but a 
  39. "few" characters) can be then examined more closely.
  40.  
  41. For a better "fuzzy compare" function I've liked the use of overlapping 
  42. character pairs (including a blank added to the start and end of each name).
  43.  
  44. I think that character ADJACENCY is an important aspect of the "visual 
  45. similarity" of two words or names.
  46.  
  47. > I'm now working on the 'when' to search for dates.  I need a different
  48. method than giving the program every possible date in every possible
  49. way.  Does someone have a program that would pick a date out of a
  50. sentence?
  51.  
  52. Certainly it ought to be very easy to parse NUMERIC dates.  And since most 
  53. formats of dates (with the exception of things like "the first of May") have 
  54. numeric characters associated with them, I wouldn't think it would be so 
  55. difficult to zero in on a very small number of possibilities, which could then 
  56. be processed by more exhaustive "multi-alternative" patterns.
  57.  
  58. It sounds like a fun project, in any case... if you decide you'd like to farm it 
  59. out, I would enjoy taking a stab at it.  :-)
  60.  
  61. Gordon Peterson
  62. http://www.computek.net/public/gep2/
  63. Support the Anti-SPAM Amendment!  Join at http://www.cauce.org/
  64.  
  65.